Основы теории принятия решений
Общие положения
1.Основные понятия системного анализа
2.Оновные понятия исследования операций 3.Постановка задач принятия оптимальных решений4.Принятие решений в условиях неопределенности
1.1. Общие положения
Человек - существо свободное и обречено на выбор решений, стараясь сделать всё наилучшим образом. В наиболее общем смысле теория принятия оптимальных решений представляет собой совокупность математических и численных методов, ориентированных на нахождение наилучших вариантов из множества альтернатив и позволяющих избежать их полного перебора. Ввиду того, что размерность практических задач, как правило, достаточно велика, а расчеты в соответствии с алгоритмами оптимизации требуют значительных затрат времени, то методы принятия оптимальных решений главным образом ориентированы на реализацию их с помощью ЭВМ.
Практическая потребность общества в научных основах принятия решений возникла с развитием науки и техники только в XVIII веке Началом науки "Теория принятия решений" следует считать работу Жозефа Луи Лагранжа, смысл которой заключался в следующем: сколько земли должен брать на лопату землекоп, чтобы его сменная производительность была наибольшей. Оказалось, что утверждение "бери больше, кидай дальше" неверен. Бурный рост технического прогресса, особенно во время и после второй мировой войны, ставил все новые и новые задачи, для решения которых привлекались и разрабатывались новые научные методы. Можно выделить следующие научно-технические предпосылки становления "Теории принятия решений":
удорожание "цены ошибки".
ускорение научно-технической революции техники и технологии
развитие ЭВМ.
Как часто это бывает, эта наука, с одной стороны, стала определенной ветвью других более общих наук (теория систем, системный анализ, кибернетика и т.д.), а с другой, стала синтезом определенных фундаментальных более частных наук (исследование операций, оптимизация и т.д.), создав при этом и собственную методологию.
Инженерное дело теснейшим образом связано с совокупностями объектов, которые принято называть сложными системами, которые характеризуются многочисленными и разнообразными по типу связями между отдельно существующими элементами системы и наличием у системы функции назначения, которой нет у составляющих ее частей. На первый взгляд каждая сложная система имеет уникальную организацию. Однако более детальное изучение способно выделить общее в системе команд ЭВМ, в процессах проектирования лесной машины, самолета и космического корабля.
В научно-технической литературе существует ряд термином, имеющих отношение к исследованию сложных систем.
Наиболее общий термин "теория систем" относится ко всевозможным аспектам исследования систем. Ее основными частями являются
системный анализ
кибернетика
Здесь следует заметить, что понятие управления не совпадает с принятием решения. Условная граница между кибернетикой и системным анализом состоит в том, что первая изучает отдельные и строго формализованные процессы, а системный анализ - совокупность процессов и процедур.
Очень близкое к термину "системный анализ" понятие - "исследование операций", которое традиционно обозначает математическую дисциплину, охватывающую исследование математических моделей для выбора величин, оптимизирующих заданную математическую конструкцию (критерий). Системный анализ может сводиться к решению ряда задач исследования операций, но обладает свойствами, не охватываемыми этой дисциплиной. Однако в зарубежной литературе термин "исследование операций" не является чисто математическим и приближается к термину "системный анализ". Широкая опора системного анализа на исследование операций приводит к таким его математизированным разделам, как
постановка задач принятия решения;
описание множества альтернатив;
исследование многокритериальных задач;
методы решения задач оптимизации;
обработка экспертных оценок;
работа с макромоделями системы.
1.2. Основные понятия системного анализа
Системный анализ - наука, занимающаяся проблемой принятия решения в условиях анализа большого количества информации различной природы.
Из определения следует, что целью применения системного анализа к конкретной проблеме является повышение степени обоснованности принимаемого решения, расширение множества вариантов, среди которых производится выбор, с одновременным указанием способов отбрасывания заведомо уступающим другим.
В системном анализе выделяют
методологию;
аппаратную реализацию;
практические приложения.
Методология включает определения используемых понятий и принципы системного подхода.
Дадим основные определения системного анализа.
Элемент - некоторый объект (материальный, энергетический, информационный), который обладает рядом важных для нас свойств, но внутреннее строение (содержание) которого безотносительно к цели рассмотрения.
Связь - важный для целей рассмотрения обмен между элементами веществом, энергией, информацией.
Система - совокупность элементов, которая обладает следующими признаками:
связями, которые позволяют посредством переходов по ним от элемента к элементу соединить два любых элемента совокупности;
свойством, отличным от свойств отдельных элементов совокупности.
Практически любой объект с определенной точки зрения может быть рассмотрен как система. Вопрос состоит в том, насколько целесообразна такая точка зрения.
Большая система - система, которая включает значительное число однотипных элементов и однотипных связей. В качестве примера можно привести трубопровод. Элементами последнего будут участки между швами или опорами. Для расчетов на прочность по методу конечных элементов элементами системы считаются небольшие участки трубы, а связь имеет силовой (энергетический) характер - каждый элемент действует на соседние.
Сложная система - система, которая состоит из элементов разных типов и обладает разнородными связями между ними. В качестве примера можно привести ЭВМ, лесной трактор или судно.
Автоматизированная система - сложная система с определяющей ролью элементов двух типов:
в виде технических средств;
в виде действия человека.
Для сложной системы автоматизированный режим считается более предпочтительным, чем автоматический. Например, посадка самолета или захват дерева харвестерной головкой выполняется при участии человека, а автопилот или бортовой компьютер используется лишь на относительно простых операциях. Типична также ситуация, когда решение, выработанное техническими средствами, утверждается к исполнению человеком.
Структура системы - расчленение системы на группы элементов с указанием связей между ними, неизменное на все время рассмотрения и дающее представление о системе в целом. Указанное расчленение может иметь материальную, функциональную, алгоритмическую или другую основу. Пример материальной структуры - структурная схема сборного моста, которая состоит из отдельных, собираемых на месте секций и указывает только эти секции и порядок их соединения. Пример функциональной структуры - деление двигателя внутреннего сгорания на системы питания, смазки, охлаждения, передачи крутящего момента. Пример алгоритмической структуры - алгоритм программного средства, указывающего последовательность действий или инструкция, которая определяет действия при отыскании неисправности технического устройства.
Структура системы может быть охарактеризована по имеющимся в ней типам связей. Простейшими из них являются последовательное, параллельное соединение и обратная связь (рис.1.1).
Декомпозиция - деление системы на части, удобное для каких-либо операций с этой системой. Примерами будут: разделение объекта на отдельно проектируемые части, зоны обслуживания; рассмотрение физического явления или математическое описание отдельно для данной части системы.
Иерархия - структура с наличием подчиненности, т.е. неравноправных связей между элементами, когда воздействие в одном из направлений оказывают гораздо большее влияние на элемент, чем в другом. Виды иерархических структур разнообразны, но важных для практики иерархических структур всего две - древовидная и ромбовидная (рис.1.2).
Древовидная структура наиболее проста для анализа и реализации. Кроме того, в ней всегда удобно выделять иерархические уровни - группы элементов, находящиеся на одинаковом удалении от верхнего элемента. Пример древовидной структуры - задача проектирования технического объекта от его основных характеристик (верхний уровень) через проектирование основных частей, функциональных систем, групп агрегатов, механизмов до уровня отдельных деталей.
Принципы системного подхода - это положения общего характера, являющиеся обобщением опыта работы человека со сложными системами. Их часто считают ядром методологии. Известно около двух десятков таких принципов, ряд из которых целесообразно рассмотреть:
принцип конечной цели: абсолютный приоритет конечной цели;
принцип единства: совместное рассмотрение системы как целого и как совокупности элементов;
принцип связности: рассмотрение любой части совместно с ее связями с окружением;
принцип модульного построения: полезно выделение модулей в системе и рассмотрение ее как совокупности модулей;
принцип иерархии: полезно введение иерархии элементов и(или) их ранжирование;
принцип функциональности: совместное рассмотрение структуры и функции с приоритетом функции над структурой;
принцип развития: учет изменяемости системы, ее способности к развитию, расширению, замене частей, накапливанию информации;
принцип децентрализации: сочетание в принимаемых решениях и управлении централизации и децентрализации;
принцип неопределенности: учет неопределенностей и случайностей в системе.
Аппаратная реализация включает стандартные приемы моделирования принятия решения в сложной системе и общие способы работы с этими моделями. Модель строится в виде связных множеств отдельных процедур. Системный анализ исследует как организацию таких множеств, так и вид отдельных процедур, которые максимально приспосабливают для принятия согласующихся и управленческих решений в сложной системе.
Модель принятия решения чаще всего изображается в виде схемы с ячейками, связями между ячейками и логическими переходами. Ячейки содержат конкретные действия - процедуры. Совместное изучение процедур и их организации вытекает из того, что без учета содержания и особенностей ячеек создание схем оказывается невозможным. Эти схемы определяют стратегию принятия решения в сложной системе. Именно с проработки связанного множества основных процедур принято начинать решение конкретной прикладной задачи.
Отдельные же процедуры (операции) принято классифицировать на формализуемые и неформализуемые. В отличие от большинства научных дисциплин, стремящихся к формализации, системный анализ допускает, что в определенных ситуациях неформализуемые решения, принимаемые человеком, являются более предпочтительными. Следовательно, системный анализ рассматривает в совокупности формализуемые и неформализуемые процедуры, и одной из его задач является определение их оптимального соотношения.
Формализуемые стороны отдельных операций лежат в области прикладной математики и использования ЭВМ. В ряде случаев математическими методами исследуется связное множество процедур и производится само моделирование принятие решения. Все это позволяет говорить о математической основе системного анализа. Такие области прикладной математики, как исследование операций и системное программирование, наиболее близки к системной постановке вопросов.
Практическое приложение системного анализа чрезвычайно обширно по содержанию. Важнейшими разделами являются научно-технические разработки и различные задачи экономики. Ссылки на системность исследований, анализа, подхода включает биологию, экологию, военное дело, психологию, социологию, медицину, управление государством и регионом, лесное и сельское хозяйство, обучение и многое другое.
1.3. Основные понятия исследования операций
Операцией называется всякое мероприятие (система действий), объединенное единым замыслом и направленное к достижению какой-то цели.
Цель исследования операций - предварительное количественное обоснование оптимальных решений.
Всякий определенный выбор зависящих от нас параметров называется решением. Оптимальным называются решения, по тем или другим признакам предпочтительные перед другими.
Параметры, совокупность которых образует решение, называются элементами решения.
Множеством допустимых решений называются заданные условия, которые фиксированы и не могут быть нарушены.
Показатель эффективности - количественная мера, позволяющая сравнивать разные решения по эффективности.
Все решения принимаются всегда на основе информации, которой располагает лицо принимающее решение (ЛПР).
Каждая задача в своей постановке должна отражать структуру и динамику знаний ЛПР о множестве допустимых решений и о показателе эффективности.
Задача называется статической, если принятие решения происходит в наперед известном и не изменяющемся информационном состоянии. Если информационное состояние в ходе принятия решения сменяют друг друга, то задача называется динамической.
Информационные состояния ЛПР могут по-разному характеризовать его физическое состояние:
Если информационное состояние состоит из единственного физического состояния, то задача называется определенной.
Если информационное состояние содержит несколько физических состояний и ЛПР кроме их множества знает еще и вероятности каждого из этих физических состояний, то задача называется стохастической (частично неопределенной).
Если информационное состояние содержит несколько физических состояний, но ЛПР кроме их множества ничего не знает о вероятности каждого из этих физических состояний, то задача называется неопределенной.
1.4. Постановка задач принятия оптимальных решений
Несмотря на то, что методы принятия решений отличаются универсальностью, их успешное применение в значительной мере зависит от профессиональной подготовки специалиста, который должен иметь четкое представление о специфических особенностях изучаемой системы и уметь корректно поставить задачу. Искусство постановки задач постигается на примерах успешно реализованных разработок и основывается на четком представлении преимуществ, недостатков и специфики различных методов оптимизации. В первом приближении можно сформулировать следующую последовательность действий, которые составляют содержание процесса постановки задачи:
установление границы подлежащей оптимизации системы,
определение показателя эффективности
выбор внутрисистемных независимых переменных,
построение модели,
Несмотря на то, модели принятия оптимальных решений отличаются универсальностью, их успешное применение зависит от профессиональной подготовки инженера, который должен иметь полное представление о специфике изучаемой системы. Основная цель рассмотрения приводимых ниже примеров - продемонстрировать разнообразие постановок оптимизационных задач на основе общности их формы.
Все оптимизационные задачи имеют общую структуру. Их можно классифицировать как задачи минимизации(максимизации) M-векторного векторного показателя эффективности Wm(x), m=1,2,...,M, N-мерного векторного аргумента x=(x1,x2,...,xN), компоненты которого удовлетворяют системе ограничений-равенств hk(x)=0, k=1,2...K, ограничений-неравенств gj(x)>0, j=1,2,...J, областным ограничениям xli<xi<xui, i=1,2...N.
Все задачи принятия оптимальных решений можно классифицировать в соответствии с видом функций и размерностью Wm(x), hk(x), gj(x) и размерностью и содержанием вектора x:
одноцелевое принятие решений
многоцелевое принятие решений
принятие решений в условиях определенности -
принятие решений в условиях неопределенности
Наиболее разработан и широко используется на практике аппарат одноцелевого принятия решений в условиях определенности, который получил название математического программирования. Более подробно задачи линейного программирования (W(x), hk(x), gj(x) - линейны) изложены в главе 2, нелинейного программирования (W(x), hk(x), gj(x) - нелинейны) - в главе 3, целочисленного программирования (x - целочисленны) - в главе 4, динамического программирования (x - зависят от временного фактора) - в главе 5.
Математический аппарат одноцелевого принятия решений в условиях неопределенности, изложенный в главе 6, представляет собой стохастическое программирование (известны законы распределения случайных величин), теории игр и статистических решений (закон распределения случайных величин неизвестен).
Методы принятия многоцелевых решений изложены в 7 главе.
Рассмотрим процесс принятия решений с самых общих позиций. Психологами установлено, что решение не является начальным процессом творческой деятельности. Оказывается, непосредственно акту решения предшествует тонкий и обширный процесс работы мозга, который формирует и предопределяет направленность решения. В этот этап, который можно назвать "предрешением" входят следующие элементы:
мотивация
возможность неоднозначности результатов;
возможность неоднозначности способов достижения результатов, то есть свобода выбора.
После этого предварительного этапа следует, собственно, этап принятия решения. Но на нем процесс не заканчивается, т.к. обычно после принятия решения следует оценка результатов и корректировка действий. Таким образом, принятие решений следует воспринимать не как единовременный акт, а как последовательный процесс.
Выдвинутые выше положения носят достаточно общий характер, обычно подробно исследуемый психологами. Более близкой с точки зрения инженера будет следующая схема процесса принятия решения. Эта схема включает в себя следующие компоненты:
анализ исходной ситуации;
анализ возможностей выбора;
выбор решения;
оценка последствий решения и его корректировка.
1.5. Принятие решений в условиях неопределенности
Постановка задачи
В изложенных выше материалах речь шла о постановках и методах решения задач, не содержащих неопределенностей. Однако, как правило, большинство реальных инженерных задач содержит в том или ином виде неопределенность. Можно даже утверждать, что решение задач с учетом разного вида неопределенностей является общим случаем, а принятие решений без их учета - частным. Однако, из-за концептуальных и методических трудностей в настоящее время не существует единого методологического подхода к решению таких задач. Тем не менее, накоплено достаточно большое число методов формализации постановки и принятия решений с учетом неопределенностей. При использовании этих методов следует иметь в виду, что все они носят рекомендательный характер и выбор окончательного решения всегда остается за человеком (ЛПР).
Как уже указывалось, при решении конкретных задач с учетом неопределенностей инженер сталкивается с разными их типами. В исследовании операций принято различать три типа неопределенностей [
14]:неопределенность целей;
неопределенность наших знаний об окружающей обстановке и действующих в данном явлении факторах (неопределенность природы);
неопределенность действий активного или пассивного партнера или противника.
В приведенной выше классификации тип неопределенностей рассматривается с позиций того или иного элемента математической модели.
Так, например, неопределенность целей отражается при постановке задачи на выборе либо отдельных критериев, либо всего вектора полезного эффекта.С другой стороны, два другие типа неопределенностей влияют, в основном, на составление целевой функции уравнений ограничений и метода принятия решения. Конечно, приведенное выше утверждение является достаточно условным, как, впрочем, и любая классификация. Мы приводим его лишь с целью выделить еще некоторые особенности неопределенностей, которые надо иметь в виду в процессе принятия решений.
Дело в том, что кроме рассмотренной выше классификации неопределенностей надо учитывать их тип (или "род") с точки зрения отношения к случайности.
По этому признаку можно различать стохастическую (вероятностную) неопределенность, когда неизвестные факторы статистически устойчивы и поэтому представляют собой обычные объекты теории вероятностей - случайные величины (или случайные функции, события и т.д.). При этом должны быть известны или определены при постановке задачи все необходимые статистический характеристики (законы распределения и их параметры).
Примером таких задач могут быть, в частности, система технического обслуживания и ремонта любого вида техники, система организации рубок ухода и т.д.
Другим крайним случаем может быть неопределенность нестохастического вида (по выражению Е.С.Вентцель [15] - "дурная неопределенность"), при которой никаких предположений о стохастической устойчивости не существует. Наконец, можно говорить о промежуточном типе неопределенности, когда решение принимается на основании каких-либо гипотез о законах распределения случайных величин. При этом ЛПР должен иметь в виду опасность несовпадения его результатов с реальными условиями. Эта опасность несовпадения формализуется с помощью коэффициентов риска.
Принятие решений в условиях риска
Как указывалось выше, с точки зрения знаний об исходных данных в процессе принятия решений можно представить два крайних случая: определенность и неопределенность. В некоторых случаях неопределенность знаний является как бы
"неполной" и дополняется некоторыми сведениями о действующих факторах, в частности, знанием законов распределения описывающих их случайных величин. Этот промежуточный случай соответствует ситуации риска. Принятие решений в условиях риска может быть основано на одном из следующих критериев:критерий ожидаемого значения
комбинации ожидаемого значения и дисперсии
известного предельного уровня
наиболее вероятного события в будущем.
Рассмотрим более подробно применение этих критериев.
Критерий ожидаемого значения (КОЗ).
Использование КОЗ предполагает принятие решения, обуславливающего максимальную прибыль при имеющихся исходных данных о вероятности полученного результата при том или другом решении. По существу, КОЗ представляет собой выборочные средние значения случайной величины. Естественно, что достоверность получаемого решения при этом будет зависеть от объема выборки. Так, если обозначить
КОЗ - Е(
x1, x2,..., xn), (6.1)где
x1, x2,..., xn - принимаемые решения при их количестве, равном n, то
E(xi) (r) M(xi), (6.2)
где
M(xi) - математическое ожидание критерия.
Таким образом, КОЗ может применяться, когда однотипные решения в сходных ситуациях приходится принимать большое число раз.
Приведем пример использования этого критерия для принятия решения.
Критерий "ожидаемого значения - дисперсия".
Как указывалось выше, КОЗ имеет область применения, ограниченную значительным числом однотипных решений, принимаемых в аналогичных ситуациях. Этот недостаток можно устранить, если применять комбинацию КОЗ и выборочной дисперсии s2. Возможным критерием при этом является минимум выражения
E(Z, s ) = E(Z) ± kЧ U(z), (6.5)
где
E(Z, s ) - критерий "ожидаемого значения - дисперсия";
k - постоянный коэффициент;
U(Z) = mZ/S - выборочный коэффициент вариации;
mZ - оценка математического ожидания;
S - оценка среднего квадратического ожидания.
Знак "минус" ставится в случае оценки прибыли, знак "плюс" - в случае затрат.
Из зависимости (6.5) видно, что в данном случае точность предсказания результата повышается за счет учета возможного разброса значений E(Z), то есть введения своеобразной "страховки". При этом степень учета этой страховки регулируется коэффициентом k, который как бы управляет степенью учета возможных отклонений. Так, например, если для ЛПР имеет большое значение ожидаемые потери прибыли, то k>>1 и при этом существенно увеличивается роль отклонений от ожидаемого значения прибыли E(Z) за счет дисперсии.
Критерий предельного уровня.
Этот критерий не имеет четко выраженной математической формулировки и основан в значительной степени на интуиции и опыте ЛПР. При этом ЛПР на основании субъективных соображений определяет наиболее приемлемый способ действий. Критерий предельного уровня обычно не используется, когда нет полного представления о множестве возможных альтернатив. Учет ситуации риска при этом может производиться за счет введения законов распределений случайных факторов для известных альтернатив.
Несмотря на отсутствие формализации критерием предельного уровня пользуются довольно часто, задаваясь их значениями на основании экспертных или опытных данных.
Критерий наиболее вероятного исхода.
Этот критерий предполагает замену случайной ситуации детерминированной путем замены случайной величины прибыли (или затрат) единственным значением, имеющим наибольшую вероятность реализации. Использование данного критерия, также как и в предыдущем случае в значительной степени опирается на опыт и интуицию. При этом необходимо учитывать два обстоятельства, затрудняющие применение этого критерия:
критерий нельзя использовать, если наибольшая вероятность события недопустимо мала;
применение критерия невозможно, если несколько значений вероятностей возможного исхода равны между собой.
Учет неопределенных факторов, заданных законом распределения.
Случай, когда неопределенные факторы заданы распределением, соответствует ситуации риска. Этот случай может учитываться двумя путями. Первый - анализом адаптивных возможностей, позволяющих реагировать на конкретные исходы; второй - методически, при сопоставлении эффективности технических решений. Суть первого подхода заключается в том, что законы распределения отдельных параметров на этапе проектирования могут быть определены с достаточной степенью приближения на основе сопоставления с аналогами, из физических соображений или на базе статистических данных и данных прогнозов.
Методический учет случайных факторов, заданных распределением, может быть выполнен двумя приемами: заменой случайных параметров их математическими ожиданиями (сведением стохастической задачи к детерминированной) и "взвешиванием" показателя качества по вероятности (этот прием иногда называют "оптимизация в среднем").
Первый прием предусматривает определение математического ожидания случайной величины v - M(v) и определение зависимости W(M(v)), которая в дальнейшем оптимизируется по u. Однако сведение к детерминированной схеме может быть осуществлено в тех случаях, когда диапазон изменения параметра u невелик или когда зависимость W(u) линейна или близка к ней.
Второй прием предусматривает определение W в соответствии с зависимостями соответственно для дискретных и непрерывных величин:
; (6.6)
, (6.7)
где
P(ui) - ряд распределений случайной величины ui;
f(ui) - плотность распределения случайной величины u.
При описании дискретных случайных величин наиболее часто используют распределения Пуассона, биноминальное. Для непрерывных величин основными распределениями являются нормальное, равномерное и экспоненциальное.
Постановка задачи стохастического программирования
При перспективном и оперативном планировании работы предприятия возникает необходимость в учете ряда случайных факторов, существенно влияющих на процесс производства. К таким факторам относятся спрос, который не всегда может быть предсказуем, непредусмотренные сбои в поступлении сырья, энергии, рабочей силы, неисправности и аварии оборудования. Еще больше случайных факторов необходимо учитывать при планировании производства, эффективность которого зависит от климатических условий, урожайности и т.д. Поэтому, например, задачи планирования лесного производства целесообразно ставить и исследовать в терминах и понятиях стохастического программирования, когда элементы задачи линейного программирования (матрица коэффициентов A, вектора ресурсов b, вектора оценок c) часто оказываются случайными. Подобного типа задачи ЛП принято классифицировать как задачи стохастического программирования (СП).
Подходы к постановке и анализу стохастических задач существенно различаются в зависимости от последовательности получения информации - в один прием или по частям. При построении стохастической модели важно также знать, необходимо ли принять единственное решение, не подлежащее корректировке, или можно по мере накопления информации один или несколько раз корректировать решение. В соответствии с этим в стохастическом программировании исследуются одноэтапные, двухэтапные и многоэтапные задачи.
В одноэтапных задачах решение принимается один раз и не корректируется. Они различаются по показателям качества решения (по целевым функциям), по характеру ограничений и по виду решения.
Задача СП может быть сформулирована в M- и P- постановках по отношению к записи целевой функции и ограничений.
Случайны элементы вектора с (целевая функция).
При M-постановке целевая функция W записывается в виде
, (6.8)
что означает оптимизацию математического ожидания целевой функции. От математического ожидания целевой функции можно перейти к математическому ожиданию случайной величины cj
. (6.9)
При P- постановке имеем:
при максимизации
(6.10)
где
Wmin - предварительно заданное допустимое наихудшее (минимальное) значение целевой функции.
при минимизации
(6.11)
где
Wmax - предварительно заданное допустимое наихудшее (максимальное) значение целевой функции.
Суть P-постановки заключается в том, что необходимо найти такие значения xj, при которых максимизируется вероятность того, что целевая функция будет не хуже предельно допустимого значения.
Ограничения задачи, которые должны выполняться при всех реализациях параметров условий задачи, называются жесткими ограничениями. Часто возникают ситуации, в которых постановка задачи позволяет заменить жесткие ограничения их усреднением по распределению случайных параметров. Такие ограничения называют статистическими:
(6.12)
В тех случаях, когда по содержательным соображениям можно допустить, чтобы невязки в условиях не превышали заданных с вероятностями, небольшими a i>0, говорят о стохастических задачах с вероятностными ограничениями:
(6.13)
т.е. вероятность выполнения каждого заданного ограничения должна быть не менее назначенной величины a i. Параметры a i предполагаются заданными или являются решениями задачи более высокого уровня.
Представленные задачи как в M-, так и в P- постановках непосредственно решены быть не могут. Возможным методом решения этих задач является переход к их детерминированным эквивалентам. В основе этого перехода лежит использование закона распределения случайной величины. В инженерной практике наиболее часто используется нормальный закон распределения, поэтому дальнейшие зависимости приведем для этого случая.
Принимаем, что aij, bi, cj подчинены нормальному закону распределения. В этом случае будет справедлива следующие детерминированные постановки:
P - постановка целевой функции, максимизация:
(6.14)
где
и s j - математическое ожидание и среднее квадратическое отклонение случайной величины cj.
P - постановка целевой функции, минимизация:
(6.15)
Вероятностные
где
- соответственно, математические ожидания и дисперсии случайных величин aij и bi;
- значение центрированной нормированной случайной величины в нормальном законе распределения, соответствующей заданному уровню вероятности соблюдения ограничений a i.
Сделаем несколько замечаний к приведенным зависимостям:
задача стохастического программирования сведена к задаче нелинейной оптимизации и может быть решена одним из рассматриваемых ранее методов;
сравнение ограничения ресурса в стохастическом программировании и аналогичным ограничением в задаче линейного программирования показывает, что учет случайного характера величин aij и bi приводит к уменьшению располагаемого ресурса на величину
, (6.16)
т.е. к необходимости в дополнительном ресурсе. Однако этот дополнительный ресурс может оказаться неиспользованным, но для гарантированного выполнения плана его иметь необходимо.
Метод статистического моделирования
Приведенные формулы (6.6) и (6.7) могут быть использованы для систем независимых случайных величин. Однако для технических систем, как правило, случайные параметры являются зависимыми. Причем эта зависимость не функциональная, а корреляционная. Поэтому для анализа случайных факторов, заданных распределением, широкое применение нашли теория марковских процессов и метод статистического моделирования (метод Монте-Карло).
В задачах принятия оптимальных решений широкое применение получил метод Монте-Карло. Основными особенностями этого метода, основанного на многократном повторении одного и того же алгоритма для каждой случайной реализации, являются: универсальность (метод не накладывает практически никаких ограничений на исследуемые параметры, на вид законов распределения); простота расчетного алгоритма; необходимость большого числа реализаций для достижения хорошей точности; возможность реализации на его основе процедуры поиска оптимальных параметров проектирования. Отметим основные факторы, определившие применение метода статистического моделирования в задачах исследования качества при проектировании: метод применим для задач, формализация которых другими методами затруднена или даже невозможна; возможно применение этого метода для машинного эксперимента над не созданной в натуре системы, когда натурный эксперимент затруднен, требует больших затрат времени и средств или вообще не допустим по другим соображениям.
Учет неопределенных пассивных условий
Неопределенные факторы, закон распределения которых неизвестен, являются наиболее характерными при исследовании качества адаптивных систем. Именно на этот случай следует ориентироваться при выборе гибких конструкторских решений. Методический учет таких факторов базируется на формировании специальных критериев, на основе которых принимаются решения. Критерии Вальда, Сэвиджа, Гурвица и Лапласа уже давно и прочно вошли в теорию принятия решений.
В соответствии с критерием Вальда в качестве оптимальной выбирается стратегия, гарантирующая выигрыш не меньший, чем "нижняя цена игры с природой":
. (6.17)
Правило выбора решения в соответствии с критерием Вальда можно интерпретировать следующим образом: матрица решений [Wir] дополняется еще одним столбцом из наименьших результатов Wir каждой строки. Выбрать надлежит тот вариант, в строке которого стоит наибольшее значение Wir этого столбца [28].
Выбранное таким образом решение полностью исключает риск. Это означает, что принимающий решение не может столкнуться с худшим результатом, чем тот, на который он ориентируется. Какие бы условия Vj не встретились, соответствующий результат не может оказаться ниже W. Это свойство заставляет считать критерий Вальда одним из фундаментальных. Поэтому в технических задачах он применяется чаще всего как сознательно, так и неосознанно. Однако в практических ситуациях излишний пессимизм этого критерия может оказаться очень невыгодным.
Применение этого критерия может быть оправдано, если ситуация, в которой принимается решение, характеризуется следующими обстоятельствами:
о вероятности появления состояния Vj ничего не известно;
с появлением состояния Vj необходимо считаться;
реализуется лишь малое количество решений;
не допускается никакой риск.
Критерий Байеса-Лапласа в отличие от критерия Вальда, учитывает каждое из возможных следствий всех вариантов решений:
. (6.18)
Соответствующее правило выбора можно интерпретировать следующим образом: матрица решений [Wij] дополняется еще одним столбцом, содержащим математическое ожидание значений каждой из строк. Выбирается тот вариант, в строках которого стоит наибольшее значение Wir этого столбца.
Критерий Байеса-Лапласа предъявляет к ситуации, в которой принимается решение, следующие требования:
вероятность появления состояния Vj известна и не зависит от времени;
принятое решение теоретически допускает бесконечно большое
количество реализаций;
допускается некоторый риск при малых числах реализаций.
В соответствии с критерием Сэвиджа в качестве оптимальной выбирается такая стратегия, при которой величина риска принимает наименьшее значение в самой неблагополучной ситуации:
(6.19)
Здесь величину W можно трактовать как максимальный дополнительный выигрыш, который достигается, если в состоянии Vj вместо варианта Ui выбрать другой, оптимальный для этого внешнего состояния, вариант.
Соответствующее критерию Сэвиджа правило выбора следующее: каждый элемент матрицы решений [Wij] вычитается из наибольшего результата max Wij соответствующего столбца. Разности образуют матрицу остатков. Эта матрица пополняется столбцом наибольших разностей Wir. Выбирается тот вариант, в строке которого стоит наименьшее значение.
Согласно критерию Гурвица выбирается такая стратегия, которая занимает некоторое промежуточное положение между крайним пессимизмом и оптимизмом:
(6.20)
где
r
- коэффициент пессимизма, выбираемый в интервале [0,1].Правило выбора согласно этому критерию следующее: матрица решений [Wij] дополняется столбцом, содержащим средние взвешенные наименьшего и наибольшего результатов для каждой строки (2.6). Выбирается тот вариант, в строках которого стоят наибольшие элементы Wir этого столбца.
При
r =1 критерий Гурвица превращается в критерий Вальда (пессимиста), а при r =0 - в критерий азартного игрока. Отсюда ясно, какое значение имеет весовой множитель r . В технических приложениях правильно выбрать этот множитель бывает так же трудно, как правильно выбрать критерий. Поэтому чаще всего весовой множитель r =0.5 принимается в качестве средней точки зрения.Критерий Гурвица предъявляет к ситуации, в которой принимается решение, следующие требования:
о вероятности появления состояния Vj ничего не известно;
с появлением состояния Vj необходимо считаться;
реализуется лишь малое количество решений;
допускается некоторый риск.
Критерий Ходжа-Лемана базируется одновременно на критериях Вальда и Байеса-Лапласа:
. (6.20)
Правило выбора, соответствующее этому критерию, формулируется следующим образом: матрица решений [Wij] дополняется столбцом, составленным из средних взвешенных (с постоянными весами) математического ожидания и наименьшего результата каждой строки. Отбирается тот вариант решения, в строке которого стоит наибольшее значение этого столбца.
При z=1 критерий преобразуется в критерий Байеса-Лапласа, а при z=0 превращается в критерий Вальда. Таким образом, выбор параметра z подвержен влиянию субъективизма. Кроме того, без внимания остается и число реализаций. Поэтому этот критерий редко применяется при принятии технических решений.
Критерий Ходжа-Лемана предъявляет к ситуации, в которой принимается решение, следующие требования:
о вероятности появления состояния Vj ничего не известно, но некоторые предположения о распределении вероятностей возможны;
принятое решение теоретически допускает бесконечно большое количество реализаций; допускается некоторый риск при малых числах реализаций.
Общие рекомендаций по выбору того или иного критерия дать затруднительно. Однако отметим следующее: если в отдельных ситуациях не допустим даже минимальный риск, то следует применять критерий Вальда; если определенный риск вполне приемлем, то можно воспользоваться критерием Сэвиджа. Можно рекомендовать одновременно применять поочередно различные критерии. После этого среди нескольких вариантов, отобранных таким образом в качестве оптимальных, приходится волевым решением выделять некоторое окончательное решение [26,28].
Такой подход позволяет, во-первых, лучше проникнуть во все внутренние связи проблемы принятия решений и, во-вторых, ослабляет влияние субъективного фактора. Кроме того, в области технических задач различные критерии часто приводят к одному результату.
Применение данных критериев с методической точки зрения удобно продемонстрировать на примере одной задачи.
Учет активных условий
Как правило, решение практических задач, связанных с оценкой качества и надежности изделий лесного машиностроения, зависит не только от оперирующей стороны (допустим, конструктора), но и от действий других субъектов системы (например, технолога-лесозаготовителя). Каждая из сторон преследует собственные цели, не всегда совпадающие друг с другом. Неопределенность такого рода при принятии решений относят к классу поведенческих неопределенностей. Теоретической основой нахождения оптимального решения в условиях неопределенности и конфликтных ситуаций является теория игр. Игра - это математическая модель процесса функционирования конфликтующих элементов систем, в котором действия игроков происходят по определенным правилам, называемых стратегиями. Ее широкому распространению в последнее время способствовало как развитие ЭВМ, так и создание аналитического аппарата, позволяющего находить аналитические решения для широкого класса задач. Основной постулат теории игр [26,28] - любой субъект системы по меньшей мере так же разумен, как и оперирующая сторона и делает все возможное, чтобы достигнуть своих целей. От реального конфликта игра (математическая модель конфликта) отличается тем, что она ведется по определенным правилам, которые устанавливают порядок и очередность действий субъектов системы, их информированность, порядок обмена информацией, формирование результата игры.
Существует много классов игр, различающихся по количеству игроков, числу ходов, характеру функций выигрыша и т.д. Выделим следующие основные классы игр:
антагонистические (игры со строгим соперничеством) и неантогонистические. В первом случае цели игроков противоположны, во
стратегические и нестратегические (в первых субъект системы действует независимо от остальных, преследуя свои цели, во-вторых субъекты выбирают единую для всех стратегию);
парные игры и игры для N-лиц;
коалиционные и бескоалиционные;
кооперативные и некооперативные (в первых возможен обмен информацией о возможных стратегиях игроков);
конечные и бесконечные (в первых - конечное число стратегий).
Наиболее полный обзор направлений теории игр в ее современном состоянии дан в работе [29].
Наибольшее распространение в технических приложениях имеют парные стратегические бескоалиционные конечные некооперативные игры. Модель проблемной ситуации в этом случае имеет вид:
< U, V, W1, W2, R1, R2 >,
где
U - множество стратегий оперирующей стороны (конструктора);
V - множество стратегий оппонирующей стороны (технолог и природа);
W1 и W2 - показатели качества игроков;
R1 и R2 - системы предпочтения игроков.
Системы предпочтения игроков, в свою очередь, основываются на двух ведущих принципах рационального поведения: принципе наибольшего гарантированного результата и принципе равновесия.
Первый основан на том, что рациональным выбором одного из игроков должен считаться такой, при котором он рассчитывает на самую неблагоприятную для него реакцию со стороны другого игрока.
Второй принцип гласит, что рациональным выбором любого игрока считается такая стратегия u$ (или v$), для которой ситуация (u$, v$) обоюдовыгодна: любое отклонение от данной ситуации игры не является выгодным ни для одного из игроков.
Решается парная матричная игра (проектируемое изделие - меры и средства противодействия) с нулевой суммой (выигрыш одной стороны равен проигрышу другой) на основе рассмотрения платежной матрицы, которая представляет собой совокупность значений U и V (пара стратегий (u,v) U x V называется ситуацией игры) а также выигрышей Wij при парном сочетании всевозможных стратегий сторон.
Решение парной матричной игры может быть в чистых стратегиях, когда для каждой из сторон может быть определена единственная оптимальная стратегия, отклонение от которой невыгодно обоим игрокам. Если выгодно использовать несколько стратегий с определенной частотой их чередования, то решение находится в смешанных стратегиях.
Основные особенности использования методов теории заключаются в следующем. В качестве возможных стратегий со стороны проектируемой системы рассматриваются возможные варианты ее строения, из которых следует выбрать наиболее рациональный. В качестве стратегий противника рассматриваются возможные варианты его противодействия, стратегии их применения.
Необходимо отметить, что при рассмотрении игр с использованием адаптивной системы число ее стратегий может быть существенно расширено благодаря реализации "гибких" конструкторских решений. Анализ игровых ситуаций в этом случае может быть направлен не только на выбор рационального варианта проектируемого изделия, но и на определение алгоритмов рационального применения системы в конфликтной ситуации.
Другая особенность применения методов теории игр заключается в выборе решений, получаемых на основе анализа конфликтной ситуации. В теории игр доказывается теорема о том, что оптимальная стратегия для каждого из игроков является оптимальной и для другого. Так, если решение игры получено в чистых стратегиях (имеется седловая точка), то выбор решения однозначен. Например, если для парной антагонистической игры 3x4 составить матрицу, где элементами uij будут выигрыши (проигрыши) игроков, то седловая точка находится на пересечении максимина строк и минимакса столбцов
Стратегии |
Стратегии B |
min | |||
A |
1 |
2 |
3 |
4 |
строк |
1 |
8 |
2 |
9 |
5 |
2 |
2 |
6 |
5 |
7 |
18 |
5 |
3 |
7 |
3 |
-4 |
10 |
-4 |
max столбцов |
8 |
5 |
9 |
18 |
|
Оптимальными стратегиями будут для A - 2, для B - 2. Цена игры равна 5. Отметим, что в случае наличия седловой точки ни один из игроков не может улучшить стратегию и стратегии называются чистыми. Отметим, что игра с чистыми стратегиями может существовать только при наличии полной информации о действиях противника.
Если же решение игры получено в смешанных стратегиях, то это эквивалентно созданию множества вариантов проектируемого компонента и использованию их с оптимальными частотам, соответствующими оптимальной смешанной стратегии. В случаях, когда не имеется полной информации о действиях противника, вводятся вероятности применения той или иной стратегии в виде векторов
P<n>=<p1, p2, ..., pn> - для игрока A, где ;
Q<m>=<q1, q2, ..., qn> - для игрока B, где .
При этом игрок A выбирает стратегию в соответствии с принципом максимина по выражению:
,
а игра B по принципу минимакса
.
Рассмотрим пример: пусть рассматривается принятие решения в игре 2x2, где игрок A знает вероятность стратегии 1, то есть p1, тогда очевидно вероятность стратегии 2 будет 1-p, соответственно стратегии игрока B будут q1 и 1-q1. Платежная матрица будет иметь вид:
|
|
B |
|
|
|
q1 |
1-q1 |
A |
p1 |
a11 |
a12 |
|
1-p1 |
a21 |
a22 |
На основании матрицы и приведенных выше выражений составляется таблица:
Чистые стратегии игрока B |
Ожидаемые выигрыши игрока A |
1 |
(a11-a21)p1 + a21 |
2 |
(a12-a22)p1 + a22 |
Из таблицы видно, что ожидаемый выигрыш игрока A линейно зависит от вероятности p1 (в данном случае задача может быть решена графоаналитически). Тогда смешанная стратегия игрока А будет иметь вид
<p*1, p*2>,
то есть игроку A выгодно применять стратегию 1 с частотой (вероятностью) - p1, а стратегию 2 с частотой p2.
Очевидно, что разработка нескольких вариантов изделия сопряжена с большими затратами, не всегда реализуема и затрудняет использование системы. Поэтому при получении решения в смешанных стратегиях рекомендуются следующие случаи принятия окончательного решения [20,26,28]:
для дальнейшего проектирования выбирается тот вариант, который гарантирует максимальное качество (выбор по максиминной стратегии аналогично критерию Вальда);
выбирается тот вариант, который в смешанной стратегии должен использоваться с максимальной вероятностью;
реализуется несколько вариантов изделия с частотами, соответствующими смешанной стратегии (создание адаптивно-модульных конструкций).
Важное значение в задачах исследования качества адаптивных систем имеет не только решение игры, но и анализ платежной матрицы. Это особенно важно в тех случаях, когда решение в смешанных стратегиях не реализуется. Этот анализ может проводиться на основе: оценки возможных потерь эффективности в случае реализации чистой стратегии; определения дополнительных затрат на их компенсацию с помощью "гибких" конструкторских решений; оценки достоверности рассмотренных стратегий противодействия; определения возможности реализации компромиссных вариантов и т.д.
Для анализа конфликтной ситуации требуется на основе математической модели операции построить платежную матрицу [Wmn] =[Wij], где Wij характеризует качество изделия при выборе i-го варианта проектируемого изделия и при j-м варианте противодействия противника.
Решение может быть получено в чистых стратегиях, когда есть седловая точка. Условие седловой точки имеет вид
, (6.21)
где левая часть выражения - нижняя цена игры, правая - верхняя цена игры.
Если условие (6.8) не выполняется, то седловая точка отсутствует и требуется реализация смешанной стратегии.
Решение в смешанных стратегиях состоит в реализации чистых стратегий с различными вероятностями, задаваемыми распределением:
для проектируемого изделия в виде вектора-столбца
G = {gi}, где i = 1,2 ...m; ;
для противодействия в виде вектора-строки
F = {fj}, где j = 1,2 ...n; ,
где
gi - вероятность выбора стратегии ui;
fj - вероятность выбора стратегии vj.
Платежную функцию запишем в следующем виде:
(6.22)
где индексом "т" обозначена процедура транспонирования.
Платежная функция W(G,F) всегда имеет седловую точку, т.е. всегда существует решение матричной игры. Это утверждение соответствует основной теореме теории матричных игр [26]: каждая матричная игра с нулевой суммой имеет, по крайней мере, одно решение в чистых или смешанных стратегиях.
Последовательность решения игры следующая:
Анализируется платежная матрица на предмет исключения заведомо невыгодных и дублирующих стратегий.
Проверяется наличие седловой точки по условию (6.21).
Если решение в чистых стратегиях отсутствует, то ищется решение в смешанных стратегиях с помощью методов линейного программирования или методом Монте-Карло.
|
|||||||
замена |
2 |
6 |
5 |
17 |
18 |
7 |
18 |
(стра- |
3 |
7 |
3 |
14 |
10 |
8 |
14 |
тегии |
4 |
4 |
6 |
16 |
9 |
19 |
19 |
эксплуа- |
5 |
12 |
4 |
15 |
8 |
10 |
15 |
тации) |
min столбца |
6 |
2 |
9 |
5 |
6 |
|